法院受理2000万人开房数据泄露案 涉上海86万人

2013年12月30日13:01  新闻晚报

  □晚报记者 钱朱建 报道

  一份名为“2000万开房数据”的资料被网友疯狂下载,引发一场关于隐私和信任的危机。大数据时代,这些信息可能会被怎样利用?背后暗藏哪些风险?我们又该如何应对?

  今天上午,全国“2000万开房数据”受害者诉讼维权第一人王金龙收到律师电话,浦东法院已受理该案。2012年12月,王金龙出差广州时曾入住汉庭酒店,他在“2000万开房数据”查到了自己入住该酒店的信息。

  近日,王金龙通过分析,完成了《上海市民信息泄露情况分析报告》,上海有86万受害人,居全国首位。

  王金龙举例说,根据被泄露的详尽个人信息,不法分子可能筛选出18—35岁女性,进行化妆品、母婴产品等定向电话骚扰。更可怕的是,一旦破译邮箱密码,还可能获取受害人微博、微信账号,向好友行骗。甚至能入侵支付宝等其他关联账户,直接威胁资金安全。

  上海样本涉及人数全国居首

  在信息安全行业工作10多年的白领王金龙和张威是开房数据泄露的受害者,由于个人隐私信息被泄露,两人饱受垃圾短信和推销电话骚扰。为此,两人发起了全国首例诉讼维权。

  他们还组建了QQ群、论坛、微信公众号等,希望联络全国受害人一起维权。但在和这些受害人交流中,两人发现,许多人对个人信息泄露的具体危害并不了解。于是,两人利用业余时间,从黑客和不法分子的思路入手,试图分析他们是如何利用这些个人信息牟利,借此给广大受害人以警醒。

  在2000万个人信息中,经过过滤,去除一些无效或重复的信息,可以得到约1800余万条个人准确的身份信息,涉及上海户籍人口为86万多人。通过分析上海的86万个样本可以看出,男女比例分为61%和39%。在女性中,18-30女性占比达38%。通过对上海19个区县进行数据分析,对应每个区的数据分布情况,其中浦东新区占20%,其次是杨浦区和普陀区、黄浦区最少。

  通过对姓氏进行分析,上海受害人中张姓第一、其次是王、陈,黄姓最少。在泄露数据中重名率最高的是张磊、王磊、张勇、王勇、李俊、王斌等。

  在上海泄露的数据中,邮箱的使用以163、126为最多,占30%,使用移动手机号码82%。

  这86万的数据分布在2010年7月份到2013年1月份,8月到12月份酒店入住率最高,周一到周日七天,周日入住率居首。

  邮箱密码泄露将有连锁反应

  对于个人信息泄露的危害,王金龙说,根据被泄露的详尽个人信息,不法分子可能筛选出18—35岁女性,进行化妆品、母婴产品等定向电话骚扰。

  “电话骚扰是一方面,但密码保护更紧迫。”王金龙说,密码管理是人人都在经历的事,但很多人在邮箱、QQ、微博、支付宝中使用相同的用户名和密码。支付宝等重要网站的防护等级可能较高,但邮箱的防护等级就偏弱。一旦邮箱密码被盗,其他的账户都可能遭殃。还有很多网站注册时要登记邮箱,在启动“找回密码”功能时,会把网站新密码发到注册邮箱内。一旦邮箱密码被攻破,不法分子完全可以通过曲线迂回的方式,利用“找回密码”功能,同样能攻破防护等级较高的网站。

  很多人习惯使用弱密码,比如用“123456”“888888”或者本人生日等作为密码,这些也很容易被人破解。“这次泄露的字段中就包括身份证号码和邮箱,如果是用生日作为密码,等于是把密码告诉别人。”王金龙提醒,密码保护的核心是进行分级管理,按照重要程度设置不同密码。为了防止密码太多容易混淆,还应该设置自己的密码规则,如事先设定好特定的数字、字母组合。

  “你的信息泄露了,别人会怎么分析,如何利用?”王金龙说,通过编制这本报告,他试图通过假设不法分子的视角和思路,向普通民众展示个人信息资料泄露的核心危机。希望基于此警示此次事件的受害者,提高防范意识,采取预防手段,减小侵害损失。“用于本报告分析的数据样本来源于互联网公开且合法的渠道,该数据样本的获取过程我们委托上海市闵行公证处进行了全程公证。”王金龙说,作为受害人,他不会将这些数据用于商业用途,也不会以任何途径传播这些个人信息。

  市民要详细阅读该报告,可以登录http://www.gerenxinxi.org/查询。

  样本解读

  泄露86万是什么概念?

  按上海市户籍人口1400万计算,86万上海人信息泄露,就相当于每17个上海人中,有1人的身份信息在其中。

  涉及个人哪些身份信息?

  据统计,网上流转的1.7G数据库中包含涉及个人信息的33个字段。其中,27个字段内容相对较完整,14个字段内容直接涉及个人信息,包括姓名、性别、国籍、民族、身份证号、生日、地址、邮编、手机、固话、传真、邮箱、公司、住宿时间。

  另外13个字段内容还有待进一步分析和理解。

  除上述直接信息外,在泄露数据中,通过对邮箱地址的分析,还可以发现一些隐性个人身份信息。包括个人的QQ号和个人网络的常用用户名(邮箱地址中 @ 前部分内容)。

  个人身份信息的重要价值在于能够锁定个人的真实性,通俗说来,就是在茫茫人海中能够直接定位想要找的对象。要实现这一点,必须获得个人的唯一标识。在本次泄露中,包括身份证号、住宅地址、手机号、邮箱地址等的线上、线下个人身份唯一标识,都统统泄露,势必为不法分子对侵犯个人的利益打开了方便之门。

  受害者中男女占比多少?

  对86万受害者进行统计,我们发现男性受害者占61%,女性占39%。

  哪个区的受害者最多?

  通过对身份证号码的分析,我们将受害者按上海市行政区进行了区分,19区1县中,发现浦东新区的受害者最多,占总数的20%,第二、三名是杨浦区、普陀区,黄浦区受害者最少,占总数的2%。

  社区受害者如何分布?

  以浦东新区为例,我们对浦东的碧云社区受害者情况进行分析,碧云社区以4869人占浦东新区的3%。分布在包括碧云路、明月路、云间路、红枫路等的十几条道路周边。受害人的数据是可以分解到各个街道、社区的,其实,我们可以继续向下分析出社区中的男女占比、年龄构成等数据。出于对被害人的保护,我们不再往下展示相关数据,但请相信,不法分子获取分析这些数据,不会像我们这么温柔,假如你正身在其中,请时刻提高警惕。

  联洋社区以12035人占浦东新区的9%。分布在包括花木路、锦绣路、芳甸路、罗山路、丁香路、白杨路等的十几条道路周边。对应于这些高档社区的人来说,本身就比较吸引那些倒卖数据的人的兴趣,包括那些所谓的私家侦探。他们对这些数据就可以发挥很大的想象空间,出于利益的诱惑,我们还是郑重提醒,该地区的人,应该特别提高警惕。

  新上海人比例占多少?

  在分析过程中,我们意外获得了一组新上海人的数据,这部分人员属于从其它国家和省市地区迁入上海并获得上海户籍的人员,总计为814242人,占据整个个人开房信息泄露总数的94%。根据推测,这些人应该是以青壮年白领为主,因工作需要出差概率高。

  姓什么外出住宿最多?

  根据统计,我们发现王、张、陈姓是数据中最多的姓氏,可能可以代表全上海目前的姓氏分布。不过,王、张、陈姓人士出差比例这么高,是说明他们商业活动活跃还是劳碌命?就不好说了。

  哪个属相外出住宿最多?

  想不到兔子、老虎、狗竟然是外出住宿的主力军,原因不得而知。网上传说是,属兔子的人对工作兢兢业业,看来是能吃的了苦、出的了差的好男人,这也是企业老板最喜欢招聘的员工。

  哪个星座最活跃?

  按照月份从小到大排名,其中天秤座以116896的数量居第一,金牛座以35855倒数第一。秋天出生的人群成为最易出差的人群。

  商务人士爱用什么邮箱?

  邮箱域名里面,哪个最多?以前听说是163,后来又听说QQ邮箱把它超越了,我们还是看数据吧。

  QQ邮箱果然不少,有14%的占比,不过,它还不是商务人士主流使用的对象,想不到用hotmail的人有这么多,占16%,但看来占绝对优势的还是网易邮箱,163和126邮箱占比加起来得有30%的份额。

  不法分子从邮箱域名中是可以获取到不少信息的,比如邮箱前缀部分,就是个人在网络上的常用用户名,不论在网站、论坛、微博,看到这个用户名,假如结合这次泄露的库,基本上就能确认本人的实际身份了;而有些人使用的是QQ邮箱,那么邮箱名中就把QQ号给泄露了; 在20%其他类型的邮箱中,有不少人使用的是公司邮箱,这一点也变相的泄露了受害者的工作单位。

  邮箱是个人在互联网上重要的身份唯一标识,配合别的信息一起被利用,危害会很大。

  泄露的是哪几年数据?

  对上海的入住数据进行年度划分,从2010年、2011年、2012年及2013年。四个年度数据,其中2010年是从7月份开始至12月31日止下半年的数据,可能是从2010年下半年数据进行重新备份,之前数据已经另作存储,实情如何,也不得而知。2011年2012年均是全年的数据,2013年则只有1月份的数据。

  从年底对比来看,2011年到2012年年度入住增长44%。酒店业近几年增量非常迅速,看来是有经济能力做好个人信息安全,但是却让民众失望。

  案例分析

  利用数据分析诈骗  成功率可提高两倍

  王金龙指出,根据假设场景,诈骗集团根据经验发现,在不采用数据分析的前提下进行电话诈骗成功率只有1%不到,诈骗集团人员希望通过分析,能把电话诈骗的成功率提高到3%以上。他们就可能在数据中锁定容易受骗的人下手。

  假设以下8个特性是诈骗集团认为的目标群的基本特征:大龄单身女性易受骗年龄在二十七八岁; 相貌平平的女性;性格外向的女性; 从乡下到城市的打工妹;虚荣心重的女人;体态丰满的女性;学历较低的女性;女财务人员。对此进一步进行数据理解。基于上海市受害人数据库,我们发现其中一些特征可以对应到数据的分析字段。对于第一条“大龄女青年”可以对应到性别和年龄字段,第三条“性格外向”对应到了星座字段,第四条“外来打工妹”对应到新上海人字段。其他特征暂未找到对应字段。不过,有这几个字段的对应,也能初步分析出些成果了。

  防范应对

  沪10%人群“高危”  建议常换邮箱密码

  在上海市86万多的受害者,我们对其初步区分了一下。发现其中受危害频次及危害程度较低的低危人群在63%左右,可能会遭受财产损失的中危人群在27%左右,可能会遭受较大经济损失或持续性危害的高危人群在8%左右,而可能会遭受人身伤害等现实侵害的极高危人群有2%。

  高危人群最好采取一些处置措施、如更换常用qq、邮箱等网络用户密码、删除一些非必要的APP、尽量少用个人电脑登录非正规站点等。极高危人群建议更换手机号码、家庭住址等。

(原标题:沪每17人中就有1人遭泄密 男性、住浦东、新上海人“高危”)

分享到:
保存  |  打印  |  关闭
猜你喜欢

看过本文的人还看过

  • 新闻9名暴徒袭击新疆莎车公安局8人被击毙
  • 体育英超切尔西2-1利物浦 阿森纳夺半程冠军
  • 娱乐张艺谋或缴纳700万超生费 妻:谣言伤害大
  • 财经揭秘习近平就餐的庆丰包子铺:100%国资
  • 科技百度影音下架盗版内容 称转型娱乐平台
  • 博客《私》的奇葩价值观 习就餐后包子铺(图)
  • 读书优劣悬殊:抗美援朝敌我装备差距有多大
  • 教育奥赛名师侵害多名男生 借查身体猥亵(图)